在 Azure Machine Learning Studio 中,可以透過 Compute Elementary Statistics 來計算資料的統計值,像是平均值、標準差、中位數等等,可以用來分析資料的集中趨勢、分散情況。
位置:Statistical Functions / Compute Elementary Statistics
Compute Elementary Statistics 計算基礎統計包含以下方法:
(1)新增成人收入調查的二元分類資料集,再來新增 Select Columns in Dataset 選取要計算的欄位,點選右手邊 Launch column selector 開啟欄位選擇工具
(2)選擇 age 年齡欄位,點選右下角勾勾確認
(3) 執行後,資料集會篩選剩下 age 年齡欄位
(4) 新增"Compute Elementary Statistics"計算基礎統計,將資料集輸出接至 Compute Elementary Statistics ,方法選擇 Max 最大值,點選 Launch column selector 開啟欄位選擇工具
(5) 選擇 age 年齡欄位,點選右下角勾勾確認
(6) 執行此計算
(7) 執行後可以看到 age 年齡的最大值是 90
要特別注意的是,跟其他運算功能不一樣,Compute Elementary Statistics 計算完的結果無法選擇 Append 的方式加到新欄位,他只會留下結果欄位,這時候可以搭配 Add Columns 或 Add Rows 的功能,合併統計後的結果,操作方式如下:
(1) 新增其他多個 Compute Elementary Statistics 來計算不同的統計資料,接著將計算後的結果接至 Add Columns,就可以合併所需要的統計資料
(2) 下方為最後合併的結果,分別計算了 age 年齡的最大值、平均數、中位數